
你的美图App,在CVPR技术5连秀
你的美图App,在CVPR技术5连秀图像编辑大礼包!美图5篇技术论文入围CVPR 2025。
图像编辑大礼包!美图5篇技术论文入围CVPR 2025。
PPT对大部分朋友的的价值不言而喻。我在日常做商业咨询时也需要大量PPT做交付,所以从年初开始,我尝试让AI来完成商业PPT的生成和设计。目前效果大致如下:视觉效果是有点超出我的预期的。而且从可读性、图形化、信息整理几个角度来说,这些结果已经完全够用了。同时这些生成的PPT可以是动态的:
还记得之前推荐过一键生成网页代码的 readdy.ai(好用到哭!AI神器Readdy,一键生成网页代码,前端工程师要失业了?),如今这样的神器市场上已冒出一大堆。我们做个详细点的对比,然后根据不同的用户场景,做出一些推荐。
在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了?
从手机随手拍、汽车行车记录仪到无人机航拍,如何从海量无序二维图像快速生成高精度三维场景?
它名为 Uni-3DAR,来自深势科技、北京科学智能研究院及北京大学,是一个通过自回归下一 token 预测任务将 3D 结构的生成与理解统一起来的框架。据了解,Uni-3DAR 是世界首个此类科学大模型。并且其作者阵容非常强大,包括了深势科技 AI 算法负责人柯国霖、中国科学院院士鄂维南、深势科技创始人兼首席科学家和北京科学智能研究院院长张林峰等。
从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。3D 结构不仅承载着丰富的物理与化学信息,也可为科学家提供解构复杂系统、进行模拟预测和跨学科创新的重要工具。
3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。
ISP芯片越来越被重视,与AI硬件的发展,尤其是AI眼镜离不开关系。